Charlotte Dupont
Google vraagt aan wie gebruik wil maken van de Translation API-tool om volgende disclaimer toe te voegen: ‘Er zijn redelijke inspanningen geleverd om een nauwkeurige vertaling te leveren, maar geen enkele computervertaling is perfect. Daarnaast is het niet onze bedoeling om menselijke vertalers te vervangen.’ Hiermee raakt het bedrijf een topic aan waar vertalers (in spe) zich wel eens zorgen om durven maken: zullen online vertaaldiensten zoals Google Translate en DeepL de menselijke vertalers overbodig maken? Optimisten beweren van niet. Computer Aided Translations (CATs) werken immers op basis van ‘statistische’ of ‘neurale’ vertalingen en zijn dus sterk afhankelijk van ‘beschikbare data’. Maar wat wil dat juist zeggen? Gert De Sutter, professor in Vertaalstudies en de Nederlandse Taalkunde aan de UGent, legt uit hoe deze populaire online tools te werk gaan en spreekt alvast duidelijke taal: helemaal het niveau van een menselijke vertaling halen ze zeker en vast nog niet, al kunnen we ze maar beter omarmen.
Werking van automatische vertalingen
‘Het is eigenlijk niet zo heel eenvoudig om uit te leggen hoe Google Translate precies werkt. Google wil daar zelf ook niet zo graag over communiceren’, begint professor De Sutter zijn uitleg. ‘Wat wel duidelijk is, is dat Google gebruik maakt van zijn enorme hoeveelheid geïndexeerde data. Meer specifiek hebben we het over zogenaamde parallelle data, data die over hetzelfde thema gaan, maar in verschillende talen zijn opgesteld. Denk aan Wikipedia, waar topics in verschillende talen worden besproken. Als je over miljoenen woorden beschikt, kunnen heel geavanceerde en krachtige computers daar patronen in ontdekken. Zo kan je bijvoorbeeld te weten komen dat bepaalde woorden in een taal heel vaak samen voorkomen met drie of vier woorden in een andere taal. Wat Google Translate dan nog het liefst van al heeft, is dat jij wijzigingen gaat aanbrengen in de geproduceerde vertaling, als je denkt dat die niet helemaal accuraat is. Op basis van heel ingewikkelde algoritmes slaagt Google er dan in om automatische vertalingen te produceren die steeds weer een beetje beter worden.’
Patronen vs. betekenissen
Statistische vertalingen zijn afhankelijk van teksten die in verschillende talen beschikbaar zijn. Bijgevolg zijn vertalingen in de meest gebruikte talen ook het meest accuraat. Toch vertellen data, complexe algoritmes en grote rekenkracht niet het volledige verhaal. Geen van de drie kan namelijk inzicht bieden in de betekenis van al die woorden. Volgens De Sutter hebben machines het daar ontzettend moeilijk mee. ‘Betekenissen kun je niet opschrijven. Je kunt alleen maar woorden opschrijven, waar wij bepaalde betekenissen mee associëren.’
In zijn boek In balans: Een inleiding tot vertaal- en tolkwetenschap legt professor De Sutter uit hoe Google in 2016 is overgegaan naar Neural Machine Translation (NMT) of ‘neurale machinevertalingen’. Ook DeepL, opgericht door Linguee in 2017, maakt gebruik van deze neurale technologie en beweert bovendien ‘the best machine translation available’ te verschaffen. Net als bij statistische vertalingen worden neurale vertalingen steeds accurater op basis van voorbeeldvertalingen. Het verschil zit echter in de contextgevoeligheid. Neurale vertaalsystemen proberen namelijk het menselijk brein na te bootsen. Net als in een brein doet de technologie beroep op een netwerk van woorden, waarin woorden die qua betekenis dichter bij elkaar aanleunen, ook letterlijk dichter bij elkaar liggen. Zo liggen ‘hond’ en ‘blaffen’ bijvoorbeeld dichter bij elkaar dan ‘hond’ en ‘regenboog’. Neurale vertaalsystemen leggen dus linken tussen de verschillende woorden in een zin, waardoor ze op zoek kunnen gaan naar de meest accurate vertaling. Hierin verschillen neurale vertalingen in kwaliteit dan ook van statistische vertalingen. Polyseme woorden (= woorden met verschillende betekenissen) blijven echter een grote moeilijkheid, ook voor deze heel geavanceerde technologie. ‘Zeker subtiele betekenissen zoals connotatie, dus een positieve of negatieve gevoelswaarde, en humor zijn dingen die zich afspelen op een hoger niveau dan wat er letterlijk staat’, licht De Sutter toe. ‘Eigenlijk verwacht je dan van zo’n machine dat die ook een soort van wereld- en cultuurkennis gaat opbouwen. Zo ver zijn we nog lang niet. Zeker voor genres waar er een vorm van creativiteit nodig is of waar ook culturele gevoeligheden kunnen spelen, is menselijke tussenkomst absoluut nodig.’ Onlangs publiceerde de Nederlandse Taalunie een vertaalpleidooi waarin ze onder meer de overheid oproept om te investeren in taal- en cultuurstudies. Dat vindt De Sutter een mooi voorbeeld van het feit dat menselijke vertalers nog absoluut nodig zijn. Voor technische, ‘drogere’ teksten zouden menselijke vertalingen wellicht echter al wat minder nodig zijn. ‘Bij handleidingen bijvoorbeeld is het systeem zodanig gesloten dat een machine eigenlijk alles wel kan leren. Zulke teksten spelen ook niet met humor en allerlei subtiele betekenissen – what you see is what you get.’
Interactie tussen mens en machine
Automatische vertalingen kunnen dus blijkbaar nog niet volledig zonder menselijke aanvulling bestaan, al geldt het omgekeerde ook. Je kunt het je als menselijke vertaler bijna niet meer permitteren om niet met die technologieën te werken. Vooral de oudere generatie vertalers lijkt het daar moeilijk mee te hebben. De Sutter: ‘Er is een soort van haat-liefdeverhouding tussen menselijke vertalers en de machines, maar ik denk dat er gewoonweg niets anders op zit dan die technologie volop te omarmen en samen te werken om vertalingen te produceren. De vertaalsector verandert ook met rasse schreden. Wat volgens mij bijvoorbeeld de toekomst wordt van het vertalen, is het zogenaamde post-editen. Dat betekent eigenlijk dat je de brontekst eerst in een machinevertaling gooit. Die geproduceerde vertaling is verre van perfect, dus kan je daar als menselijke vertaler aan beginnen te sleutelen. Dat gaat natuurlijk veel sneller dan wanneer je from scratch moet beginnen, en dat is ook wat veel opdrachtgevers willen. Ze willen bij wijze van spreken de dag erna of een paar uur later al een vertaling hebben, en dat kun je vaak niet doen als menselijke vertaler alleen.’
Er is dus duidelijk geen ontkomen aan. ‘Ik denk dat dat op zich ook een hele goede zaak is’, meent De Sutter. ‘Onze wereld is heel globaal, economieën uit alle hoekjes van de wereld komen met elkaar in contact. Dat betekent dus dat er veel intercultureel contact is en dat er heel veel vertalingen nodig zijn. Met alle menselijke vertalers die er op de wereld rondlopen, kom je er gewoonweg niet. Je zou ze 24 uur op 24 moeten laten werken om alles te vertalen. Het is dus nog maar een geluk dat we die machinevertalingen ook hebben.’
Charlotte Dupont is 22 jaar, heeft een achtergrond in Communicatiewetenschappen en rondt binnenkort haar master Journalistiek af aan de KU Leuven in Antwerpen. e-mail: charlotte.dupont1@student.kuleuven.be